Fechar

1. Identificação
Tipo de ReferênciaVídeo em Evento (Audiovisual Material)
Sitemtc-m16c.sid.inpe.br
Identificador8JMKD3MGPDW34P/43HC39E
Repositóriosid.inpe.br/mtc-m16c/2020/11.05.16.41
Última Atualização2020:11.05.16.41.12 (UTC) simone
Repositório de Metadadossid.inpe.br/mtc-m16c/2020/11.05.16.41.12
Última Atualização dos Metadados2021:09.16.19.16.55 (UTC) simone
Chave de CitaçãoSilvaJúnior:2020:AbInCi
TítuloO KNN e o desafio do Titatnic: uma abordagem introdutória da ciência de dados
FormatoOn-line.
Ano2020
Data de Acesso15 maio 2024
Tipo SecundárioPRE CN
Número de Arquivos1
Tamanho23906 KiB
2. Contextualização
AutorSilva Júnior, Antonio Carlos da
AfiliaçãoUniversidade Federal do Paraná (UFPR)
Endereço de e-Mail do Autorjuniorssz@gmail.com
Nome do EventoWorkshop dos Cursos de Computação Aplicada do INPE, 20 (WORCAP)
Localização do EventoSão José dos Campos
Data8-11 e 14-17 set. 2020
Editora (Publisher)Instituto Nacional de Pesquisas Espaciais (INPE)
Cidade da EditoraSão José dos Campos
Título do LivroVídeos
Tipo Terciáriopalestra
Histórico (UTC)2020-11-09 17:35:27 :: simone -> administrator :: 2020
2020-11-26 14:06:24 :: administrator -> simone :: 2020
2020-11-27 17:53:41 :: simone -> administrator :: 2020
2021-03-29 22:55:28 :: administrator -> simone :: 2020
3. Conteúdo e estrutura
É a matriz ou uma cópia?é a matriz
Estágio do Conteúdoconcluido
Transferível1
ResumoA ciência de dados é uma área de estudo multidisciplinar que tem se tornado cada vez mais popular entre as empresas de todo o planeta. Esta área tem como principal objetivo a extração de informações relevantes à partir de dados brutos, visando o melhor apoio à tomada de decisão. Esta ciência lida com técnicas estudadas há décadas, que vem ganhando destaque nos últimos anos em virtude do aumento da capacidade computacional para o processamento de um grande volume de dados que tem praticamente dobrado a cada ano. Estes dados são obtidos a partir de diversas fontes, como bancos de dados transacionais, redes sociais e dispositivos IOT, por exemplo. Contudo, eles necessitam de alguma intervenção profissional para a detecção e a eliminação de inconsistências, de modo a possibilitar as melhores e mais confiáveis análises. Dada a popularidade da ciência de dados entre as empresas e a dificuldade de se formar um profissional com boa capacitação nos pilares da ciência da computação, estatística / matemática e conhecimento de negócio, a demanda pelo cientista de dados no mercado de trabalho tem aumentado cada vez mais e, em consequência, o interesse pelo ingresso nesta nova profissão tem sido cada vez maior. O desafio do Titanic, promovido pela Kaggle que é uma plataforma que hospeda competições de ciência de dados, normalmente é a porta de entrada dos aspirantes a cientista de dados para o mundo da modelagem preditiva. No entanto, a falta dos recursos adequados para lidar com a etapa de preparação dos dados acaba comprometendo o sucesso da análise. Portanto, a proposta deste trabalho é uma abordagem por meio do conjunto de dados do desafio do Titanic, ao qual será demonstrada a etapa de tratamento e preparação dos dados com a utilização da linguagem de alto nível R apoiada pelo algoritmo KNN para a imputação de dados ausentes. Com a aplicação destas técnicas, além da obtenção de um conjunto de dados lapidado para aplicação da análise preditiva requerida pelo desafio, pode-se constatar que a abordagem é viável e plausível para ser aplicada em situações do mundo real, uma vez que os dados obtidos pelas empresas, mesmo em contexto e dimensões diferentes, muitas vezes são apresentados de forma semelhante. Este estudo tem o propósito de mostrar de maneira lúdica a importância de uma boa análise exploratória e do tratamento dos dados levantados, podendo assim auxiliar a Academia em estudos futuros, bem como orientar e incentivar os novos profissionais.
ÁreaCOMP
Tipotecnologia da informação
Arranjo 1urlib.net > BDMCI > Fonds > WORCAP > O KNN e...
Arranjo 2urlib.net > BDMCI > Fonds > WORCAP > XX WORCAP > O KNN e...
Arranjo 3urlib.net > BDMCI > Fonds > Produção anterior à 2021 > LABAC > XX WORCAP > O KNN e...
Conteúdo da Pasta docacessar
Conteúdo da Pasta sourcenão têm arquivos
Conteúdo da Pasta agreementnão têm arquivos
4. Condições de acesso e uso
URL dos dadoshttp://urlib.net/ibi/8JMKD3MGPDW34P/43HC39E
URL dos dados zipadoshttp://urlib.net/zip/8JMKD3MGPDW34P/43HC39E
Idiomapt
Arquivo AlvoKNN e desafio do Titanic_ Abordagem introdutória da ciência de dados - Antonio C. da Silva Jr.mp4
Grupo de Usuáriossimone
Visibilidadeshown
Licença de Direitos Autoraisurlib.net/www/2012/11.12.15.03
Permissão de Leituraallow from all
Permissão de Atualizaçãonão transferida
5. Fontes relacionadas
Repositório Espelhoiconet.com.br/banon/2005/09.28.12.40
Unidades Imediatamente Superiores8JMKD3MGP8W/38ELNHL
8JMKD3MGPDW34P/43LA7CL
Lista de Itens Citandosid.inpe.br/mtc-m16c/2020/11.23.17.27 2
Acervo Hospedeirosid.inpe.br/mtc-m18@80/2008/03.17.15.17
6. Notas
Notas(15 min)
Campos Vaziosarchivingpolicy archivist callnumber contenttype copyholder creatorhistory descriptionlevel dissemination doi e-mailaddress group holdercode isbn issn keywords label lineage mark nextedition numberofslides orcid parameterlist parentrepositories previousedition previouslowerunit progress project readergroup resumeid rightsholder schedulinginformation secondarydate secondarykey secondarymark session shorttitle sponsor subject tertiarymark url versiontype volume
7. Controle da descrição
e-Mail (login)simone
atualizar 


Fechar